שיעורים ופרופורציות הפרופורציה של תופעה שווה למספר האנשים שהם בעלי אותה תכונה מחולק במספר האנשים הנחקרים. ההימצאות (או שכיחות) (prevalence) של תכונה שווה לפרופורציית האנשים באוכלוסייה שהם בעלי אותה תכונה. ההארעות (incidence) של תכונה שווה לפרופורציית האנשים באוכלוסייה הרוכשים את התכונה במשך חלון זמן נתון. המונח שיעור (rate) של תכונה יכול להתייחס לפרופורצייה, להימצאות או להארעות, בהתאם להקשר. דוגמה: במחקר של מנסון ושותפים על הקשר בין הליכה ומחלות לב אצל נשים, במהלך 8 שנים של מעקב, חלו 645 ממחלות לב. האם זה הרבה או מעט? השתתפו במעקב. כדי לענות, חשוב לדעת כמה אחיות המחקר כלל 7,488 אחיות. לכן השיעור של מחלות לב הוא = 645/7,488 0.0089 או 89 לכל 10,000 אחיות. נהוג להציג הארעות ביחס לתקופת זמן סטנדרטי. במקרה זה, נראה מתאים לחשב את ההארעות על בסיס שנתי. השיעור השנתי של מחלות לב אצל האחיות הוא 8/(645/7,488) = 0.0011, או 11 מקרים לכל 10,000 אחיות כל שנה. השואה בין שיעורים. מטרה נפוצה היא להשוות בין שיעורים או פרופורציות. בניסויים קליניים, כמובן, רוצים לבדוק האם הטיפול הנסיוני משפר את שיעור ההחלמה לעומת טיפול סטנדרטי. במחקרים אפידימיולוגיים, מחפשים גורמים הקשורים לשיעורי תמותה או תחלואה. גורמים כאלה נקראים גורמי סיכון factors).(risk למשל, במחקר על הליכה אצל האחיות, השאלה המרכזית היתה האם הליכה מקטינה את השיעור של מחלות לב. במחקר על אפיון גנטי וקרישי דם, קשורה להופעה של קרישים. השאלה היתה האם נוכחות הגן
במחקרים על גורמי סיכון, יש שלושה מדדים מקובלים לצורך השוואה בין השיעורים של מחלה. נתבונן בשתי קבוצות, עם שיעורים p 1 ן- p, בהתאמה. שני מדדים נפוצים להשוות ביניהם הם: הסיכון המוחלט =.p 1 -p בלועזית,. absolute risk הסיכון היחסי =.p 1 /p בלועזית,.relative risk המדד השימושי ביותר תלוי במטרות ובהשלכות של המחקר. לדוגמה, נסתכל על נתונים מאחד המחקרים הגדולים הראשונים על תמותה הקשורה לעישון סיגריות. מחקר זה, שנערך על ידי Doll ו-,Hill עקב במשך שנים רבות אחרי רופאים בבריטניה, בגילאים 35 ומעלה בתחילת המחקר. להלן חלק מן התוצאות: תמותה (ל- 100,000) לפי קבוצות עישון -- מסרטן ריאות ממחלות לב מעשנים (5+ גרם ליום) לא מעשנים סיכון מוחלט סיכון יחסי כללית 1884 135 559 1.4 599 4 177 1.4 166 7 159 3.7 איפה רואים את בעיות הבריאות עקב עישון, במחלות לב או בסרטן ראיות? הסיכון המוחלט גבוה יותר עבור מחלות לב -- התוספת מעישון למספר הנפטרים כל שנה ממחלות לב גדולה מן התוספת מסרטן ריאות. מדד זה משקף חשיבות, למשל, מבחינת בריאות הציבור. הסיכון היחסי מצביע בצורה חד-משמעית על סרטן ריאות. מוות ממחלה זו נדירה מאוד אצל לא מעשנים, אבל עולה באופן חד אצל המעשנים. לכן, סיכון יחסי יותר קשור לשאלה האפידימיולוגית, האם הגורם בעל חשיבות בהסברת האתיולוגיה של המחלה.
דוגמה: במחקר על הליכה ובעיות לב, ביטאו את התוצאות במונחים של סיכון יחסי. החוקרים מצאו שהסיכון היחסי של קבוצת ההליכה המרבית לעומת אלה שלא הלכו היה 0.65. החוקרים הגדירו 5 קבוצות גם לפי מדד של שריפת אנרגיה אצל האחיות. הסיכונים היחסיים של כל אחת מ- 4 הקבוצות הגבוהות יותר לעומת הקבוצה הנמוכה היו 0.74 0.81, 0.88, ו- 0.66. הערה: היחסים הנ ל משקפים תיקון להבדלי גיל ומשתנים פרוגנוסטיים חשובים בין הקבוצות. מדד חשוב נוסף להשוואה בין שני שיעורים הוא יחס הסיכויים ratio),(odds המוגדר על ידי OR = [p 1 (1-p )]/[p (1-p 1 )]. אם = 1,OR פרוש הדבר ששיעורי התופעה בשתי הקבוצות שווים זה לזה. אם OR גדול מ- 1, שיעור גבוה יותר בקבוצה 1 ואם OR קטן מ- 1, השיעור גבוה יותר בקבוצה. דוגמה: המחקר על טיפוס גנטי בוורידים. קבוצה חולים ביקורת C677T) (MTHFR וקרישים Odds=p/(1-p) 1- p p 0.95 0.167 0.77 0.857 0.8 0.143 OR = 0.95/0.167 = 1.77 מסקנה: אנשים עם הטיפוס הגנטי עומדים בסכנה מוגברת לסבול מקרישים בוורידים.
למה OR עדיף על סיכון יחסי במחקר זה? נראה שהסיכון היחסי נותן מדד יותר ישיר להגברת הסיכון אצל אנשים עם הטיפוס הגנטי. אז אולי עדיף לחשב כאן את הסיכון היחסי. מדדי השואה וסוגי מחקר. להלן שלוש תוכניות מחקר אפשריות כדי לבדוק האם הגן של MTHFR הוא גורם סיכון לקרישי דם בוורידים: 1. מחקר חתך עם סיווג לפי MTHFR ובעיית קרישים.. מחקר הכולל מדגמים נפרדים לפי שני מצבי MTHFR ובודק האם יש בעיית קרישים. 3. מחקר מקרה-ביקורת כפי שבוצע. נניח שתמונת האוכלוסייה היא כך: סובל מ- VTE לא כן MTHFR 3% שלילי 84% 1% חיובי 1%
הצפי ממדגם חתך של 400 איש: סובל מ- VTE 1 4 336 48 MTHFR שלילי חיובי לא כן ניתן לאמוד את כל השיעורים, את הסיכון היחסי, ואת ה-.OR Relative Risk = (4/5)/(1/348) =.3. OR = (4/48)/(1/336) =.33. הצפי ממדגמים נפרדים לפי מצב MTHFR של 411 איש: סובל מ- VTE כן לא MTHFR 7 196 שלילי 16 19 חיובי ניתן לאמוד את כל השיעורים למעט השיעור הכולל של.VTE Relative Risk = (16/08)/(7/03) =.3. OR = (16/19)/(7/196) =.33. הצפי ממדגם של 400 איש במחקר מקרה-ביקורת: סובל מ- VTE 150 50 175 5 שלילי חיובי לא כן MTHFR אי אפשר לאמוד את השיעור של VTE באף קבוצה. Relative Risk =?. OR = (50/5)/(150/175) =.33.
ליחס הסיכויים יתרון חשוב -- ניתן לחשבו בכל מערך מחקר וגודלו אינו מושפע על ידי שיטת המחקר. במחלה נדירה, יחס הסיכויים די קרוב מספרית לסיכון היחסי. בדוגמא שלנו, הנחנו שהשכיחות של VTE היא 4% ומצאנו שהסיכון היחסי היה 3.37 ויחס הסיכויים 3.67. ככל שהשכיחות קטנה יותר, שני המדדים מתקרבים זה לזה. לכן, במחקר על מחלות נדירות, יחס הסיכויים יכול לשמש גם כאומדן לסיכון היחסי. יתרון של מחקר מקרה-ביקורת הוא ההבטחה של מספר לא מבוטל של חולים, במיוחד כאשר חוקרים מחלה נדירה. הסקה סטטיסט ית לשיעורים ופרופורציות דנו במחקר מקרה-ביקורת על הקשר בין אפיון גנטי (לגן (MTHFR ובעיות של קרישי דם. נתוני המחקר נראו כך: חולי VTE מספר נבדקים 16 מספר חיובי ל- MTHFR 37 אחוז חיובי ל- MTHFR.8 14.3 48 ביקורת 336 הנה מספר שאלות של החוקרים: 1. מה השיעור של הטיפוס הגנטי המיוחד בכל האוכלוסייה הבריאה? החולה ב-?VTE. האם שיעור הגן באוכלוסייה באמת שונה מ- 10%? 3. מהו ההפרש בין שני השיעורים? 4. האם ניתן להסיק בביטחון ששיעור הגן יותר גבוה אצל החולים? 5. מה ערכו האמיתי של יחס הסיכויים? נראה בהמשך איך לענות על כל השאלות.
1. מה השיעור ) ( של הטיפוס הגנטי המיוחד בכל האוכלוסייה הבריאה? החולה ב- ) VTE )? p p 1 נתחיל עם האוכלוסייה הבריאה. בקבוצת הביקורת, 48 מתוך 336 נבדקים היו חיוביים, פרופורציה מדגמית של = 0.143 1 ˆp. "הכובע" מסמן שמדובר באמדן מדגמי לתכונה של האוכלוסייה. האם השיעור הנצפה המדגמי יהיה שווה בדיוק לשיעור באוכלוסייה? סביר להניח שלא. לכן, חשוב להשקיע מחשבה מה מידת הטעות. לשם כך, נפעיל את התיאוריה של חוקי ההסתברות. לפי משפט הגבול המרכזי, ההפרש בין תשיעור במדגם pˆ 1 לבין. p 1 p )/ השיעור האמיתי p 1 מתפלג נורמלית עם סטיית תקן n אפשר לאמוד את סטיית התקן על ידי הצבת pˆ 1 בנוסחה. בדוגמה שלנו, נקבל סטיית תקן של במקום 1( 1 p 1 ( 0.143)(0.857) / 336 = 0.019 עכשיו ניתן להסיק מסקנות ברורות לגבי "מידת הפיספוס" באמידת השיעור באוכלוסייה. למשל, אנחנו יודעים, לפי העקומה הנורמלית סטנדרטית, שבהסתברות 95%, pˆ 1 p 1.96 0.019 = 0.037 1 שיעור הטיפוס הגנטי שקיבלנו במדגם היה = 0.143 1 pˆ. לכן, מאוד סביר שהשיעור האמיתי לא יותר קטן מ- = 0.106 0.037 0.143 ולא יותר גדול מ- = 0.180 0.037.0.143 + הרווח (0.106,0.180) נקרא רווח בר סמך ל- בלועזית: 95% confidence interval p 1 ברמת סמך 95%. רמת הסמך (או רמת הביטחון) נובעת מן הבחירה שלנו להתחיל את החישוב עם שטח של 95% מתחת לעקומה הנורמלית. ניתן היה לבחור שטח אחר ואז היינו משנים את רמת הסמך ואת "הכופל" הנשלף מן הטבלה הנורמלית. הבחירות הטיפוסיות הן רמות סמך של 95%, 99% ו- 90%.
מה המטרה ומה הפירוש של רווח בר סמך? רווח סמך מוסר לנו מידע על תכונה באוכלוסייה המעניינת אותנו. במקום למסור מספר בודד לתכונה, רווח הסמך מוסר טווח של ערכים המתאימים לתכונה לפי תוצאות המדגם. הסתכלות בטווח הזה מאפשרת לנו להעריך מהו הערך ובנוסף להתרשם האם המדגם מספק מידע מאוד מדויק או די מעורפל לגבי ערכו של התכונה. בדוגמה שלנו, המדגם הצליח לדייק עד כדי כך שבביטחון 95%, ניתן לקבוע שהשיעור האמיתי הוא בין 0.106 ו- 0.180. מה המטרה ומה הפירוש של רווח הסמך? רווח הסמך מקבל את פירושו מן השיקולים ההסתברותיים הקובעים את ההתפלגות של pˆ 1. אילו בחרנו מדגם חדש, היינו מקבלים שיעור מדגמי אחר וגם רווח סמך אחר. לפי התיאוריה, אם ניקח הרבה מדגמים ולכל אחד נחשב רווח סמך ברמת סמך 95%, נמצא ש- 95% מן הרווחים הם "מצליחים" במובן זה שהשיעור האמיתי אכן נמצא בין קצוות הרווח. הגרף מציג 5 רווחי סמך "טיפוסיים" כאשר השיעור האמיתי הוא 0.15. לשים לב שכל הרווחים "מצליחים", למעט מדגם 7. 5 CI's, True Rate = 0.15 Rate 0.05 0.10 0.15 0.0 0.5 0 5 10 15 0 5 Sample
מה השיעור האמיתי של הטיפוס הגנטי אצל חולי?VTE השיעור במדגם היה 0.8 מתוך 16 חולים. לכן סטיית התקן היא ( 0.8)(0.77) /16 = 0.033. לכן רווח בר סמך (ברמת סמך 95%) לשיעור האמיתי יהיה: 0.8-1.96(0.033) = 0.163 0.8 + 1.96(0.033) = 0.93. הרווח יותר רחב בקרב החולים כיוון שגודל המ דגם יותר קטן.. האם שיעור הטיפוס הגנטי באוכלוסייה באמת שונה מ- 10%? p 1 p 1 בקבוצת הביקורת, 48 מתוך 336 נבדקים היו חיוביים, פרופורציה מדגמית של = 0.143 1 pˆ. האם יתכן לקבל תוצאה כל כך גבוהה במדגם אם = 0.10? נניח לרגע ש- = 0.10 ונפעיל שוב את הרעיונות שפיתחנו בהסתברות. תחת ההנחה שלנו, אנחנו יודעים שההתפלגות של pˆ 1 צריכה להיות התפלגות נורמלית אם תוחלת 0.10 וסטיית תקן. ( 0.1)(0.9) / 336 = 0.0164 לכן, שוב תחת ההנחה של 10% באוכלוסייה, מתברר ש- Z = p 0.1 ˆ1 (.1)(.9) / 336 ~ N (0,1). נחשב את Z לנתונים שלנו ונבדוק האם התוצאה מן המדגם "תואמת" את הציפייה התיאורטית. מנתוני המדגם, Z = 0.143 0.1 (.1)(.9) / 336 =.6.
0.4 0.3 Prediction From Theory If p1=0.1. 0. Sample Result 0.1 0.0-3 - -1 0 1 3 התוצאה במדגם שלנו לא נראית אופיינית להתפלגות. נהוג למדוד עד כמה היא לא אופיינית על ידי חישוב השטח מתחת לעקומת ההתפלגות ועוד יותר קיצוני מ-.6. לשים לב שתוצאה של Z העולה על.6 תיראה יותר קיצונית אבל גם תוצאה נמוכה במיוחד, ובפרט פחות מ-.6-, תיראה יותר קיצונית נגד 0.10 מאשר זו של המדגם שלנו. לכן, נחשב את הסכום של השטח משמאל ל-.6- והשטח מימין ל-.6. ניתן לחשב את השטח משמאל ל-.6- ב- EXCEL על ידי =NORMDIST(-.6,0,1,TRUE) התשובה: 0.0044. לכן סכום השטחים = 0.0088. מסקנה: תוצאות המדגם לא נראות מתאימות להנחה ש- = 0.1 p ונותנות גיבוי לדחיית השערה זו. הסיכום הנפוץ בספרות הרפואית יהיה כך: ניתן לדחות את ההשערה ש- = 0.1 p ברמת מובהקות נצפית (או (p-value של 0.0088. 1
ההגדרה של רמת המובהקות הנצפית :(p-value) ההסתברות לקבל תוצאה מדגמית כמו זו של המדגם הנוכחי, או עוד יותר קיצוני מזו של המדגם, אם אכן ההשערה הנבדקת היא נכונה. לשים לב שככל שרמת המובהקות הנצפית קטנה יותר, יש עדות חזקה יותר נגד ההשערה הנבדקת. איך יתכן רמת מובהקות נצפית נמוכה? הסבר א': ההשערה בכל אופן נכונה אך קיבלנו תוצאות נדירות במדגם. הסבר ב': ההשערה איננה נכונה. רמת המובהקות הנצפית היא מדד ל"עד כמה נדיר" התוצאות של המדגם אם ההשערה הנבדקת נכונה. 3. מהו ההפרש (1 p ( בין שני השיעורים? p הגיוני לאמוד את הפרש השיעורים על ידי ההפרש במדגם pˆ p ˆ1 = 0.085 בדומה לדיון בשיעור בודד, חשוב לצרף הערכה של מידת ההבדל בין התוצאה המדגמית לבין הפרש השיעורים האמיתי. נעשה זאת על ידי חישוב רווח בר סמך להפרש השיעורים. ראינו שכל אחת מן הפרופורציות המדגמיות מתפלגת נורמלית. לכן ˆp, מתפלגת נורמלית. לכן, אם נצליח גם ההפרש שלהן, 1ˆp לאמוד את סטיית התקן של ההפרש, אפשר לחשב רווח בר סמך בדיוק כמו שעשינו במקרה של קבוצה בודדת. תזכורת: Var( pˆ pˆ ) = Var( pˆ ) + Var( pˆ ) 1 p(1 p) p1(1 p1) = + 16 336 1 נציב בנוסחה את השיעורים המדגמיים כדי לאמוד את השונות של ההפרש.
האומדן לשונות: האומדן לסטיית התקן: (.8)(.77) 16 +. 00145 = (.143)(.857) =.00145 336 0.038 רווח הסמך להפרש השיעורים ברמת סמך 95%: 0.085-1.96(0.038) = 0.010 0.085 + 1.96(0.038) = 0.160 4. האם ניתן להסיק בביטחון ששיעור הגן יותר גבוה אצל החולים? אפשר לערוך מבחן שמתבסס על ההתפלגות של למבחן הזה יש גרסה כמעט שקולה לגמרי, הנקראת מבחן בריבוע). גרסה זו היא הנפוצה בספרות הרפואית.. χ pˆ p ˆ1 (חי נתוני המחקר הראו ש-.8% מן החולים ב- VTE התגלו כחיוביים גנטית ל- MTHFR לעומת 14.3% מקבוצת הביקורת. החוקרים מעונינים לשכנע שמצב זה מצביע על כך שאכן לאנשים שהם חיוביים ל- MTHFR סיכון מוגבר לחלות ב-.VTE הסבר חלופי: אין כל הבדל אמיתי בין הקבוצות וההבדל הנצפה הוא מקרי בלבד. המבחן הסטטיסטי בודק האם, לאור הנתונים, ההסבר החלופי נראה בכלל סביר. אם כן, קשה לומר שיש עדות משכנעת שקיים סיכון מוגבר לאנשים שהם חיוביים ל-.MTHFR אם ניתן להפריך את ההסבר החלופי, החוקרים מחזקים את טענתם. נארגן את נתוני המחקר בטבלה הבאה: % חיובי שלילי חיובי קבוצה.8 15 37 VTE 14.3 88 48 ביקורת 17.1 413 85 סה כ
אם באמת אין הבדל בין הקבוצות, ניתן להעריך את שיעור החיוביים ל- MTHFR כ- 17.1%, בלי תלות בקבוצה. אם כן, כמה חיוביים היה צפוי לראות בקבוצת ה-?VTE התשובה ההגיונית היא 17.1% כפול 16, או 7.65 חיוביים. אפשר לחשב באותו אופן ערך מצופה לכל אחד מ- 4 התאים של הטבלה בשקף הקודם. נקבל את הטבלה הבאה: סה"כ שלילי חיובי קבוצה 16 134.35 7.65 VTE ביקורת סה כ 57.35 336 498 78.65 413 85 קרל פירסון Pearson) (Karl הציע שיטה לבדוק את ההשערה שאין הבדל תוך השואה בין שתי הטבלאות. נסמן ב- OBS i את הערך הנצפה בתא i של הטבלה וב- EXP i את הערך הצפוי. הסטטיסטי של פירסון הוא χ = ( OBS i EXP EXP i i ). הסכום רץ על כל התאים בטבלה. חישוב הסטטיסטי לנתונים על MTHFR ו- :VTE (15 134.35) (37 7.65) + 134.35 7.65 (88 78.65) (48 57.35) + + 78.65 57.35 = 5.65 מתי נשתכנע שההבדל הוא אמיתי ולא מקרי? אם הטבלה הנצפית שונה מספיק מן הטבלה הצפויה. כלומר, אם הסטטיסטי χ הוא גדול.
האם 5.65 מספיק גדול? כדי לענות, אנחנו צריכים לדעת מה היה צפוי אם, באמת, אין הבדל בין הקבוצות. התשובה אם אין הבדל, ההתפלגות של הסטטיסטי של פירסון היא מה שנקרא התפלגות חי בריבוע עם דרגת חופש אחת. האם תוצאות המחקר מפריכות את הטענה של הבדל מקרי בלבד? נסכם את חוזק התוצאות על ידי חישוב של ה-,p-value כלומר על ידי חישוב ההסתברות לקבל תוצאה של 5.65 או יותר מהתפלגות חי בריבוע עם דרגת חופש אחת. ניתן לבצע את החישוב ב- EXCEL על ידי =CHIDIST(5.65,1) התוצאה: = p-value.0.017 כלומר, רק 0.017 לקבל הבדל כל כך גדול. אם באמת אין הבדל, סיכוי של ניתן לבצע את הניתוח בקלות רבה ב-.SPSS בוחרים Analyze Descriptive Statistics Crosstabs ואז בוחרים את האופציה של סטטיסטיים. תחת אופציה זו, מסמנים את הקופסא של מבחני חי בריבוע. על מנת לקבל את האחוזים בכל תא, אפשר לבחור באופציה Cells ואז לסמן את הקופסאות של אחוזים. GROUP * MTHFR Crosstabulation GROUP Total 1.00.00 Count % within GROUP % within MTHFR % of Total Count % within GROUP % within MTHFR % of Total Count % within GROUP % within MTHFR % of Total MTHFR.00 1.00 Total 15 37 16 77.%.8% 100.0% 30.3% 43.5% 3.5% 5.1% 7.4% 3.5% 88 48 336 85.7% 14.3% 100.0% 69.7% 56.5% 67.5% 57.8% 9.6% 67.5% 413 85 498 8.9% 17.1% 100.0% 100.0% 100.0% 100.0% 8.9% 17.1% 100.0%
Pearson Chi-Squa Continuity Correct a Likelihood Ratio Fisher's Exact Tes Linear-by-Linear Association N of Valid Cases Chi-Square Tests Value df (-sided) 5.650 b 1.017 5.06 1.04 5.446 1.00 5.638 1.018 498 a. Computed only for a x table Asymp. Sig. Exact Sig. Exact Sig. (-sided) (1-sided).0.013 b. 0 cells (.0%) have expected count less than 5. The minimum expecte 7.65. מבחן חי בריבוע או רווח בר סמך?? ברוב המקרים, מעניין לבצע את שניהם. המבחן עונה על השאלה הספציפית, האם יתכן שההפרש במדגם הוא מקרי בלבד. רווח הסמך נותן תמונה מהו ההפרש האמיתי, תוך דגש על הדיוק בו ניתן לאמוד את ההפרש מן המדגם. לשים לב שיש גם הקבלה בין המבחן לבין רווח הסמך. העובדה שרווח הסמך ברמת סמך 95% להפרש השיעורים לא כלל 0 מקביל לכך שבמבחן היה "מובהק" עם p-value קטנה מ- 5%. 5. מה ערכו האמיתי של יחס הסיכויים? נזכור שיחס הסיכויים מוגדר על ידי OR = [p (1-p 1 )]/[p 1 (1-p )]. האומד הפשוט הטבעי של ה- OR מתקבל מהצבת השיעורים במדגם: [(.8)(.857)]/[(.143)(.77)] = 1.77. איך אפשר לחשב רווח סמך ל-?OR האומד ל- OR מורכב ממנות של ממוצעים ואין שום סיבה לצפות שביטוי כזה יתפלג נורמלית.
הפתרון מתקבל ממעבר לסקלה לוגריתמית. מתברר שהלוגריתם הטבעי של OR כן מתפלג, בקירוב, נורמלית. מרכז ההתפלגות הוא הלוגריתם של ה- OR האמיתי וניתן לאמוד את השונות על ידי כאשר,b,a בדוגמה שלנו נקבל כאומדן לשונות 1 + = 0.059355 48 1 1 1 1 + + +. a b c d c, ו- d הם הספירות בארבעת התאים של טבלת הנתונים. 1 15 + 1 37 + 1 88 וכאומדן לסטיית התקן = 0.44 059355. הלוגריתם של ה- OR המדגמי הוא ln(1.77) = 0.571 לכן רווח סמך ברמת סמך 95% ללוגריתם של OR יהיה 0.571-1.96(0.44) = 0.093 0.571 + 1.96(0.44) = 1.049 כדי לקבל רווח סמך ברמת סמך 95% ל-,OR נעביר את הגבולות חזרה לסקלה המקורית: exp(0.093) = 1.10 exp(1.049) =.85 תיקון למשתנים נוספים. האם תמיד ניתן להשוות בין שני שיעורים? לדוגמא, אם נשווה שיעורי תמותה אצל מעשנים ולא מעשנים, מה נמצא? למה? יש תמיד סכנה להשוות שיעורים כאשר קיימים גורמים נוספים ברקע העלולים לשבש את ההשוואה. גורמים כאלה נקראים.confounders שתי שיטות נפוצות לטפל בגורמים כאלה הן התנייה וסטנדרטיזציה. בהתנייה, קודם כל מחלקים את הנתונים לקבוצות בהן משתנה הרקע מקבל את אותו הערך. אז, מבצעים השוואה נפרדת של השיעורים בתוך כל קבוצה. יש מספר דרכים לאחד את התוצאות הנפרדות, למשל דרך רגרסיה לוגיסטית או מבחן.Mantel-Haenszel
Standardization מאמר בהארץ מסוף ינואר 001 פרסם שיעורי תמותה של פגים השיעורים היו מפורקים בהתאם למשקל בארץ, בארה"ב ובקנדה. הלידה של התינוק. להלן התוצאות (באחוזים): קנדה ארה"ב ישראל משקל 38 44 71 500-749 14 1 4 750-999 5 5.4 1.3 1000-149 4 3.4 3.4 150-1499 איך כדאי להשוות בין המדינות? אפשרות אחת להתבונן בכל הטבלה. אפשרי כאן, אבל זה הופך להיות מסורבל אם יש הרבה תאים טבלה. אפשרות אחרת לחשב לכל מדינה את סה"כ שיעור התמותה. אבל כאן יש בעיה השיעור בסה"כ תלוי לא רק בשיעורים בכל קבוצת משקל, אלא גם בכמה תינוקות יש בכל קבוצה. נדגים זאת על ידי הסתכלות בשתי התפלגויות היפוטטיות לצורך השואה בין ישראל לארה"ב. תיאור היפוטטי 1: ישראל ארה"ב משקל תינוקות תמותה תינוקות תמותה 44 10 71 1 749-1 4 0 999-5.4 30 1.3 8 149-3.4 38 3.4 40 1499-9.95 סה"כ 18.1 סה"כ
תיאור היפוטטי : ישראל ארה"ב משקל תינוקות תמותה תינוקות תמותה 44 10 71 749-1 4 13 999-5.4 30 1.3 5 149-3.4 38 3.4 60 1499-9.95 סה"כ 9.66 סה"כ בתיאור השני, התמונה מתהפכת! הסיבה ברורה: תיארנו מצב בו יש בארה"ב אחוז גבוה יותר של תינוקות בעלי "סיכון גבוה" כתוצאה ממשקל לידה נמוך. במקרה כזה, שיעור התמותה הפשוט אינו נותן השואה "הוגנת" בין שתי המדינות כי ההבדלים ביניהן מבחינת משקל בלידה בנויים לתוך השיעורים. במקום, ניתן להגדיר "חלוקה סטנדרטית" של התינוקות על פני קבוצות משקל ולחשב שיעורי תמותה "מתוקננים" בהתאם. בלועזית,.standardized rates להלן שיעורים סטנדרטים, על פי המשקלים האמריקאים: ישראל ארה"ב משקל תינוקות תמותה תמותה 44 71 10 749-1 4 999-5.4 1.3 30 149-3.4 3.4 38 1499-9.95 סה"כ 17.36